草庐IT

html - xpath:仅提取以开头的类

全部标签

ruby - 如何创建 nokogiri 不区分大小写的 Xpath 选择器?

我正在使用nokogiri来选择“关键字”属性,如下所示:putspage.parser.xpath("//meta[@name='keywords']").to_html我正在使用的其中一个页面的关键字标签带有大写字母“K”,这促使我使查询不区分大小写。AND所以,我的问题是:使nokogiri选择不区分大小写的最佳方法是什么?编辑下面Tomalak的建议非常适合这个特定问题。我还想使用这个例子来帮助更好地理解nokogiri,并且有几个我想知道但没有成功搜索的问题。例如,正则表达式“伪类”是NokogiriDocs吗?适合这样的问题吗?我也很好奇nokogiri中的matches?

iphone - 如何从视频中提取方向信息?

在网络上浏览了大量文档后,iPhone似乎总是以480x360的纵横比拍摄视频,并在视频rails上应用变换矩阵。(480x360可能会改变,但对于给定设备而言始终相同)这是一种在iOS项目中修改ffmpeg源代码并访问矩阵http://www.seqoy.com/correct-orientation-for-iphone-recorded-movies-with-ffmpeg/的方法这是在iOS-4中查找转换矩阵的更清晰的方法Howtodetect(iPhoneSDK)ifavideofilewasrecordedinportraitorientation,orlandscape.

ruby - 在 Ruby 中,将 "chomp"放在字符串开头而不是结尾的最简单方法是什么?

在Ruby中,有时我需要删除字符串开头的换行符。目前我所做的如下。我想知道最好的方法。谢谢。s="\naaaa\nbbbb"s.sub!(/^\n?/,"") 最佳答案 lstrip似乎是您想要的(假设应保留尾随空格):>>s="\naaaa\nbbbb"#=>"\naaaa\nbbbb">>s.lstrip#=>"aaaa\nbbbb"来自文档:Returnsacopyofstrwithleadingwhitespaceremoved.SeealsoString#rstripandString#strip.http://ruby-

ruby - 如何在 Ruby 中提取整数的符号?

我需要一个返回/打印整数符号的函数。到目前为止,我想出了这个:defextract_sign(integer)integer>=0?'+':'-'end是否有内置的Ruby方法可以做到这一点? 最佳答案 这里有一个简单的方法:x=-3"++-"[x0]#=>"-"x=0"++-"[x0]#=>"+"x=3"++-"[x0]#=>"+"或x=-3"±+-"[x0]#=>"-"x=0"±+-"[x0]#=>"±"x=3"±+-"[x0]#=>"+" 关于ruby-如何在Ruby中提取整数的符

ruby - 在 Ruby 中提取 URI 最后一段的最佳方法

给定的URI字符串如下:http://www.somesite.com/abchttp://www.somesite.com/alpha/beta/abchttp://www.somesite.com/alpha/abc在Ruby中获取这些URI末尾的abc最优雅的方法是什么? 最佳答案 我会使用合适的URI解析器,例如URImodule中的一个。从URI获取路径。然后在/处拆分,得到最后一部分:require'uri'URI(uri).path.split('/').last 关于ru

ruby - 是否有任何使用游标或智能提取的 Ruby ORM?

我正在寻找一个RubyORM来替代ActiveRecord。我一直在研究Sequel和DataMapper。它们看起来很不错,但是它们似乎都没有做基本的事情:在不需要时不将所有内容加载到内存中。我的意思是我已经在ActiveRecord和Sequel上尝试了以下(或等效的)在有很多行的表上:posts.each{|p|putsp}他们俩都为内存疯狂。他们似乎将所有内容都加载到内存中,而不是在需要时获取内容。我在ActiveRecord中使用了find_in_batches,但这不是一个可接受的解决方案:ActiveRecord不是一个可以接受的解决方案,因为我们在使用它时遇到了太多问题

Ruby Rack - 安装一个默认读取 index.html 的简单 Web 服务器

我正在尝试从本教程中获取一些信息:http://m.onkey.org/2008/11/18/ruby-on-rack-2-rack-builder基本上我想要一个文件config.ru告诉rack读取当前目录,这样我就可以访问所有文件,就像一个简单的apache服务器一样,还可以读取带有索引的默认根目录.html文件...有什么办法吗?我当前的config.ru看起来像这样:runRack::Directory.new('')#thiswouldreadthedirectorybutitdoesn'tsettheroottoindex.htmlmap'/'dofile=File.re

ruby - 如何从文本中提取 URL

如何从Ruby中的纯文本文件中提取所有URL?我尝试了一些库,但在某些情况下它们会失败。什么是最好的方法? 最佳答案 如果您喜欢使用Ruby中已经为您提供的功能:require"uri"URI.extract("textherehttp://foo.example.org/blaandheremailto:test@example.comandherealso.")#=>["http://foo.example.org/bla","mailto:test@example.com"]阅读更多:http://railsapi.com/d

ruby - 如何获取节点的原始 HTML

我正在使用Nokogiri来分析一些HTML,但是,我不知道如何在节点中获取原始HTML。例如,给定:97462012-06-26当我使用这个XPath选择器时:doc=Nokogiri::HTML(html)nodes=doc.search("//tr[@class='tablebX']")nodes.eachdo|node|node.text#ornode.contentendnode.text和node.content的结果是:97462012-06-26我想获取trblock中的所有原始HTML,在这种情况下,它是:97462012-06-26正确的做法是什么?

ruby - 如何从 Proc 对象中提取代码?

给定一个Proc对象,是否可以查看其中的代码?例如:p=Proc.new{test=0}我需要的是通过某种方式从已创建的Proc对象中获取字符串“test=0”。 最佳答案 您可以使用ruby2ruby图书馆:>>#testedwith1.8.7>>require"parse_tree"=>true>>require"ruby2ruby"=>true>>require"parse_tree_extensions"=>true>>p=Proc.new{test=0}>>p.to_ruby=>"proc{test=0}"您还可以将此过程